智能论文笔记

Deep learning generates custom-made logistic regression models for explaining how breast cancer subtypes are classified

Takuma Shibahara , Chisa Wada , Yasuho Yamashita , Kazuhiro Fujita , Masamichi Sato , Junichi Kuwata , Atsushi Okamoto , Yoshimasa Ono

分类：机器学习 | 人工智能 | (统计)机器学习

2020-01-20

区分乳腺癌的内在亚型对于决定最佳治疗策略至关重要。深度学习可以比常规统计方法更准确地从遗传信息中预测亚型，但是迄今为止，尚未直接利用深度学习来检查哪些基因与哪些亚型相关。为了阐明嵌入在内在亚型中的机制，我们开发了一个可解释的深度学习模型，称为点线性（PWL）模型，该模型为每个患者生成定制的逻辑回归。逻辑回归是医生和医学信息学研究人员都熟悉的，使我们能够分析特征变量的重要性，而PWL模型则利用了逻辑回归的这些实际能力。在这项研究中，我们表明分析乳腺癌亚型对患者有益，也是验证PWL模型能力的最佳方法之一。首先，我们使用RNA-Seq数据训练了PWL模型，以预测PAM50固有的亚型，并通过亚型预测任务将其应用于PAM50的41/50基因。其次，我们开发了一种深度富集分析方法，以揭示PAM50亚型与乳腺癌的拷贝数之间的关系。我们的发现表明，PWL模型利用与细胞周期相关途径相关的基因。这些在乳腺癌亚型分析中取得的初步成功证明了我们分析策略的潜力，以阐明乳腺癌的基础机制并改善整体临床结果。

translated by 谷歌翻译

我们提出了一种使用预训练的语言模型的新的无监督方法，用于词汇替换。与以前使用语言模型的生成能力预测替代品的方法相比，我们的方法基于上下文化和脱皮的单词嵌入的相似性检索替代品，即单词在多个上下文中的平均上下文表示。我们以英语和意大利语进行实验，并表明我们的方法基本上要优于强大的基准，并在没有任何明确的监督或微调的情况下建立了新的最新技术。我们进一步表明，我们的方法在预测低频替代品方面的表现特别出色，还产生了多种替代候选者列表，从而减少了根据文章 - 名称协议引起的形态寄电或形态句法偏见。

translated by 谷歌翻译